max rank | avg. rank | sentence |
---|---|---|
299 | 95.9000 | Da jih nikoli več ne bo, pa je že vprašanje. |
329 | 100.6364 | Če jim ne bo uspelo, pa tudi ne bo konec sveta. |
362 | 118.6923 | "Že veliko dni me ni doma in še veliko dni me ne bo. |
402 | 162.4444 | Še posebej če ne bomo začeli na pravi način. |
428 | 149.2000 | Kako pa se drugi imajo, tega tudi jaz ne vem. |
430 | 190.5000 | In potem nisem imela več težav z njimi. |
437 | 97.8000 | Če bi se to zgodilo, bi bilo pa že preveč. |
456 | 114.9091 | A po drugi strani - kaj bi še sploh imel od življenja? |
487 | 177.5000 | To nikoli ni bil človek, ni človek in nikoli ne bo človek. |
490 | 137.2727 | A se to po njegovih besedah za zdaj še ni zgodilo. |
511 | 168.0000 | Sicer pa se še nikoli nisem imela tako zelo lepo kot zdaj. |
513 | 197.0000 | In vprašanje je, kdaj ga bo sploh dobila. |
514 | 165.6667 | Po njegovih besedah to "ne bo veliko več, 10 ali 20 evrov". |
517 | 202.1111 | Sicer pa, ali je sploh kdaj bilo kako drugače. |
520 | 241.1250 | Vendar pa imamo zdaj tudi veliko novih možnosti. |
523 | 224.3333 | "Ko sem bila otrok, doma nismo imeli veliko denarja. |
529 | 221.4444 | Do konca tedna bo tako jasno kako in kaj. |
536 | 157.3939 | Na delu znova tudi Slovenci - zurnal24Zurnal24.si uporablja piškotke z namenom zagotavljanja boljše uporabniške izkušnje, funkcionalnosti in prikaza oglasnih sistemov, zaradi katerih je naša storitev brezplačna in je brez piškotkov ne bi mogli omogočati. |
549 | 151.8182 | Kar je dovolj, je dovolj' Za ocenjevanje je potrebno biti prijavljen. |
582 | 193.2353 | Toda, to je tako, kot nekateri pravijo za ženske: z njimi je težko, brez njih ne gre. |
592 | 213.8571 | To je pomembno vprašanje, to je problem. |
593 | 194.6667 | Zakaj in kako mi ni jasno in je verjetno jasno samo njim. |
603 | 95.6667 | Mislim, da bi lahko bilo tako tudi pri nas. |
606 | 116.1667 | Da se sploh ne ve več, kaj je res in kaj ne. |
606 | 266.0000 | Kako kmalu se bo to zgodilo, nihče ne ve. |
610 | 320.2000 | ” Če želite komentirati, se prijavite. |
611 | 190.6250 | Pri pomoči namreč po njegovih besedah ne bo šlo le za banke, to bo le del. |
623 | 233.6364 | Ne gre in ne gre'' Za oddajo komentarja morate biti prijavljeni! |
623 | 370.1667 | € Za oddajo komentarja morate biti prijavljeni! |
626 | 186.3333 | Kaj več, kar sicer vem, ne bi povedal javno. |
The maximum word rank of a sentence is by definition the rank of the rarest word in the sentence. If it is low, all words in the sentence are of high frequency. For this reason the table of the sentences with least maximum word number might be of interest. In the table, we see the corresponding sentences with a minimum length of 40 characters.
The over all distribution of the maximum rank in all sentences of the corpus is shown in a diagram with log-scaled x-axis.
The sentences in the table described above are of interest because they are usually easy to understand. The distribution may give insights into the corpus and may give parameters for language comparison.
While the distribution might be deduced from a small corpus, the sentences in the table are rare and a large corpus will give more impressive results.
Table data:
select max(w_id)-100 as m, avg(w_id)-100 as a, s.sentence from sentences s, inv_w i where s.s_id=i.s_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by m limit 30;
Distribution data;
select m, count(*) from (select 100* round((max(w_id)-100)/100) as m from sentences s, inv_w i where s.s_id=i.s_id and i.w_id>100 group by s.s_id) aa group by m;
Explain the distribution, especially the increase in its right part.
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.7 Sentences consisting of long words only I
4.5.2.8 Sentences consisting of long words only II